Глобальное и локальное выравнивание аминокислотных последовательностей.

Работа с программами Excel, Matcher, Needle, Water.


Матрица переходов.

Матрица глобального выравнивания стоилась для последовательностей: CIAEF и IAF
Матрица локального выравнивания строилась для последовательностей: SQTSTLKGQ и QTKGQ.

параметры, использовавшиеся при построении матрицы

  • Вес совпадения: 2
  • Вес замены: -1
  • Штраф за делецию (вставку): -2
  • Глобальное выравнивание:

    Выравнивание, соответствующее оптимальному пути.

    CIAEF
    -IA-F

    Вес оптимального пути: 2

    Локальное выравнивание:

    Выравнивание, соответствующее оптимальному пути.

    KGQ
    KGQ

    Вес оптимального пути: 6

    Выравнивание, соответствующее субоптимальному пути.

    QT
    QT

    Вес cубоптимального пути: 4


    Поиск участков локальной гомологии.


    Последовательности, для которых строилось локальное выравнивание:

    1. Белок глицеропорин из E. coli:

    MSQTSTLKGQCIAEFLGTGLLIFFGVGCVAALKVAGASFGQWEISVIWGLGVAMAIYLTA
    GVSGAHLNPAVTIALWLFACFDKRKVIPFIVSQVAGAFCAAALVYGLYYNLFFDFEQTHH
    IVRGSVESVDLAGTFSTYPNPHINFVQAFAVEMVITAILMGLILALTDDGNGVPRGPLAP
    LLIGLLIAVIGASMGPLTGFAMNPARDFGPKVFAWLAGWGNVAFTGGRDIPYFLVPLFGP
    IVGAIVGAFAYRKLIGRHLPCDICVVEEKETTTPSEQKASL

    2. Искусственно созданная последовательностью, которая состоит из двух коротких участков последовательности белка глицеропорин из E. coli.

    TLKGQCIAEFCVVEEKETTT

    Координаты первого участка: (TLKGQCIAEF) 6-15;
    Координаты второго участка: (CVVEEKETTT) 264-273. (Координаты выяснены вручную).

    Выводы и результаты по полученному локальному выравниванию:

    Благодаря программе matcher получены следующие координаты:


    Координаты первого участка: (TLKGQCIAEF) 6-15;
    Координаты второго участка: (CVVEEKETTT) 264-273.
    Данные результаты полностью подтверждают полученные вручную.


    Влияние параметров на глобальное выравнивание.


    Параметры, при которых выравнивания были построены:
    1.1 Матрица замен: EBLOSUM80,
    1.2. Штраф за начало гэпа: 1,
    1.3. Штраф за продолжение гэпа: 1
    1.4 Вес выравнивания:109
    1.5 Идентичность:4,9


    2.1 Матрица замен: EBLOSUM40,
    2.2. Штраф за начало гэпа: 1,
    2.3. Штраф за продолжение гэпа: 1
    2.4 Вес выравнивания: 99
    2.5 Идентичность:4,9 %

    Суть отличий (из-за использования разных матриц замен):
    1. В первом предпочтительнее для программы была вставка гэпов, чем замена. Это связано с тем, что в матрице Blosum60 за замену накладывается больший штраф, чем в Blosum40.В результате оказывается, что вставка гэпа лучше (меньший штраф), чем замена.
    2. Рассмотрим по частям:
    В матрице Blosum60 вес замен Q-R и Q-H одинаков: 1, а в матрице Blosum40 вес замены Q-R больше, чем для Q-H. А так как штрафы за открытие гэпа и его продолжения одинаковы, то во втором выравнивании программа предпочла замену Q-R замене Q-H, представленной в первом выравнивании.
    Выравнивание по матрице Blosum40 выполненное способом, избранным программой для выравнивания с матрицей Blosum60, дает более низкий результат, чем избранный программой. (1 и 2 соответственно), наоборот - дает тот же результат. Это основано на том, что различные замены и совпадения оцениваются в разных матрицах по-разному. Например, R-T: -1 в матрице Blosum60 и -2 в матрице Blosum40, L-L: 4 - Blosum60 и 6 - Blosum40

    Главная страница